|
2014. №4 (30)
|
Анализ данных и интеллектуальные системы
|
7–16
|
Коломейченко Максим Игоревич - выпускник магистратуры, Национальный исследовательский университет «Высшая школа экономики»; Адрес: 101000, Москва, Мясницкая ул., 20. E-mail: maxim.kolomeychenko@mail.ru
Чеповский Андрей Михайлович - кандидат технических наук, доцент кафедры информационной безопасности, факультет бизнес-информатики, Национальный исследовательский университет «Высшая школа экономики»; профессор кафедры прикладной математики и моделирования систем, Институт коммуникаций и медиабизнеса, Московский государственный университет печати им. Ивана Федорова. Адрес: 127550, г. Москва, ул. Прянишникова, 2а. E-mail: achepovskiy@hse.ru
Задача визуализации графов больших размеров возникает в различных областях социологии и маркетинга. Актуальность данной работы определяется потребностью в программном комплексе для анализа и визуализации таких графов. В работе приводится анализ нескольких программных продуктов и выделяются их недостатки: отсутствие кроссплатформенности и специализированных графовых хранилищ, а также невозможность работы с графами больших размеров. Приводится детальное описание общей архитектуры разработанного программного обеспечения и каждого модуля в отдельности, способы взаимодействия основных модулей. Для хранения графов используется разработанное специализированное графовое хранилище, позволяющее обрабатывать графы, имеющие порядка 100 миллионов вершин и нескольких миллиардов связей. Также представлено описание основных принципов организации хранилища. Использование собственной файловой системы обеспечивает отсутствие дополнительных системных вызовов при работе с хранилищем и отсутствие сложной системы адресации и лишних механизмов, что приводит к избавлению от дополнительных накладных расходов, связанных с организацией хранения данных. Кроме того, присутствует описание методики работы модуля визуализации данных, используемых структур данных и алгоритмов машинной графики, которые позволяют работать с графами, состоящими из нескольких миллионов вершин, в режиме реального времени. Отдельно стоит отметить широкий набор алгоритмов автоматического размещения графов: случайное размещение, круговое размещение, круговое покомпонентное размещение, размещение «павлиний хвост», размещения «одна и две линии темы», размещения, основанные на алгоритме выделения сообществ или на алгоритме оценки связности. Приводится детальное описание каждого приведенного выше алгоритма. Особое внимание стоит уделить используемым методам анализа графа. Разработаны алгоритмы выделения сообществ в социальных сетях, оценки связности графа, поиск кратчайших путей между любой парой вершин, объединение и пересечение графов и многое другое. Ключевой особенностью всех приведенных в работе алгоритмов является возможность работы с графами больших размеров. |
|
17–23
|
Ланин Михаил Олегович - аспирант кафедры распознавания изображений и обработки текста, факультет инноваций и высоких технологий, Московский физико-технический институт (государственный университет); программист, ООО «Аби Продакшн». Адрес: 141700, Московская обл., г. Долгопрудный, Институтский пер., д. 9. E-mail: mike.lanin@gmail.com
Статья посвящена проблеме потокового извлечения данных из документов полужесткой структуры, для которых слабо применимы методы сплошного оптического распознавания символов. Для облегчения процесса создания структурных описаний таких документов широко используются методы машинного обучения. Тем не менее, существующие решения по-прежнему достаточно сложны для конечного пользователя, поскольку требуют ручного описания элементов структуры документа, не имеющих прямого отношения к извлекаемым данным. В работе рассматривается возможный подход к описанию изображений документов переменной структуры, используемый в системе потокового ввода ABBYY FlexiCapture, а также метод автоматического построения такой структурной модели по разметке всех элементов структуры. Подробно описывается алгоритм автоматического поиска опорных элементов по пользовательской разметке извлекаемых данных, позволяющий значительно облегчить с точки зрения пользователя процесс создания структурной модели документа ABBYY FlexiCapture. Интеграция описанной технологии обучения на этапе верификации извлекаемых данных позволяет инкрементально улучшать структурную модель документа, при этом все, что требуется от конечного пользователя – исправлять неверно найденные в процессе ввода регионы извлекаемых полей. Также в статье описан метод и результат оценки эффективности предложенного подхода. Описанный способ поиска опорных элементов показал свою применимость на реальных платежных документах ряда немецких поставщиков: 89,3% счетов могут быть обработаны без ошибок при минимальном участии пользователя, при этом верно извлечены данные из 97,8% полей. |
|
24–35
|
Орлов Михаил Анатольевич - аспирант кафедры анализа данных и искусственного интеллекта, факультет компьютерных наук, Национальный исследовательский университет «Высшая школа экономики». Адрес: 101000, Москва, Мясницкая ул., 20. E-mail: ormian@mail.ru
Данная работа развивает подход к проблеме многокритериального ранжирования, называемый нами многокритериальной стратификацией. При таком подходе представляет интерес не столько полное упорядочивание вариантов, сколько разбиение множества вариантов на заданное число классов, упорядоченных по предпочтению. Ранжирование получается путем линейной свертки критериев с весами. При этом веса определяются, исходя из предположения о наличии некоторой структуры в данных, такой что можно выделить «параллельные» слои – страты. В работе [6] авторы сформулировали задачу формирования оптимальной стратификации, как задачу оптимизации некоторой целевой функции относительно весов критериев, однако, предложенный в этой работе алгоритм решения получаемой задачи, использующий случайный поиск, оказался неэффективным по сравнению с другими методами стратификации. В данной работе предлагается новый алгоритм оптимизации целевой функции многокритериальной стратификации на основе квадратичного программирования. Для всестороннего экспериментального исследования качества работы алгоритма предлагается усовершенствованная модель генерации искусственных стратифицированных данных. Новая модель генерации страт имеет больше параметров для настройки и позволяет гибко задавать геометрию страт: ориентацию, толщину, размах и интенсивность, что лучше учитывает структуру реальных данных. Предлагаемый алгоритм экспериментально сравнивается с существующими методами стратификации на искусственных данных, и показывается его преимущество в большинстве рассмотренных случаев. Рассматриваются два примера реальных данных – библиометрические показатели 118 научных журналов и характеристики публикационной активности 102 стран. На этих данных новый алгоритм приводит к хорошо интерпретируемым и адекватным результатам. Также оказалось, что на этих данных построенное алгоритмом многокритериальное разбиение наиболее согласовано с разбиениями, построенными по отдельно взятым критериям. |
Информационные системы и технологии в бизнесе
|
36–44
|
Фомин Игорь Николаевич - аспирант кафедры прикладной информатики и программной инженерии, Международный факультет прикладных информационных технологий, Саратовский государственный технический университет им. Ю.А.Гагарина. Адрес: 410054, г. Саратов, ул. Политехническая, д. 77 E-mail:ignik16@yandex.ru
Сердюкова Надежда Викторовна - магистрант кафедры прикладной информатики и программной инженерии, Международный факультет прикладных информационных технологий, Саратовский государственный технический университет им. Ю.А.Гагарина. Адрес: 410054, г. Саратов, ул. Политехническая, д. 77 E-mail: serdukova@orgcentr.com
В статье рассматривается задача построения расчетной модели измерения электроэнергии (calculated measurement model of electric power) в информационных системах для автоматизированного ценообразования на розничном рынке электроэнергии РФ. Объект исследования – розничный рынок электроэнергии (the retail electricity market) и бизнес-процессы энергосбытовых предприятий, предмет исследования – массивы данных об энергопотреблении различного рода потребителей (consumption habits). Цель исследования – построение концепции и модели информационной системы, позволяющей рассчитывать розничную цену и стоимость потребленной электроэнергии. Решенными задачами в исследовании явились: · определение сущностей, которые являются параметрами для расчета цены и стоимости электроэнергии; · классификация и определение критериев классификации учетных (user data) и расчетных показателей (estimates data), участвующих в автоматизированном ценообразовании; · подбор различных вариантов интеграции этих параметров; · моделирование структуры базы данных, которая формирует расчетную модель измерений электроэнергии. В статье даны определения учетных и расчетных показателей, которые являются элементами отраслевых корпоративных информационных систем, описаны принципы формирования модели измерения электроэнергии (calculated measurement model of electric power) при создании и внедрении биллинговых информационных систем (meter to cash systems), а также даны определения различных терминов электроэнергетики с точки зрения информатики и информационных технологий. Ценообразование на розничном рынке электроэнергии рассмотрено как некий социально-экономический процесс, к которому были применены методы математического моделирования и системного анализа. Предложенные критерии классификации и правила построения связей в структуре базы данных обладают устойчивыми связями элементов и организацией, что проявилось в выявленном снижении энтропии системы в целом по сравнению системообразующими элементами и факторами. Выявленные и описанные связи могут помочь на практике в задачах отраслевой программной инженерии и параметрической адаптации при разработке биллинговых информационных систем. В описанном исследовании произведено моделирование структуры базы данных, формирующей расчетную модель измерений электроэнергии, позволяющую оперировать различными договорными и техническими параметрами электроснабжения (contractual input), а также определять розничную цену и стоимость потребленной электроэнергии. Теоретические и аналитические исследования позволили создать авторам инновационный продукт в виде программы для ЭВМ «АС Энерго.УПЭЛ», зарегистрированной Свидетельством о госрегистрации № 2013615624 (опубликовано 17.06.2013), который успешно апробировался на предприятиях энергетической отрасли в нескольких регионах РФ. |
|
45–52
|
Чеботарёв Валерий Георгиевич - кандидат технических наук, доцент кафедры моделирования и оптимизации бизнес-процессов, факультет бизнес-информатики, Национальный исследовательский университет «Высшая школа экономики» Адрес: 101000, г. Москва, ул. Мясницкая, д. 20. E-mail: vchebotarev@hse.ru
Громов Александр Игоревич - кандидат химических наук, профессор кафедры моделирования и оптимизации бизнес-процессов, факультет бизнес-информатики, Национальный исследовательский университет «Высшая школа экономики» Адрес: 101000, г. Москва, ул. Мясницкая, д. 20 E-mail: agromov@hse.ru
Материалы статьи основаны на результатах, полученных участниками (преподавателями и студентами) научно-исследовательского семинара факультета бизнес-информатики НИУ ВШЭ. Цель – исследование возможностей управления обучением как процессом, применение современных информационных технологий и инструментов. Дано определение процесса обучения как совместной деятельности участников процесса в организации усвоения учебной дисциплины, получения субъективно новых или новых предметных и процедурных знаний. В качестве предмета исследования выбран процесс обучения конкретной дисциплине «Моделирование и оптимизация бизнес-процессов». Выполнен анализ особенностей процесса обучения, определены требования к управлению процессом обучения, выполнено моделирование и оценка возможностей автоматизированного управления процессом обучения. Для анализа использована информация об организации и проведении реальных занятий на факультете бизнес-информатики. Выявлены следующие требования к процессу обучения: быстрая адаптация к изменениям, гибкое управление с учетом различных методов обучения, постоянное взаимодействие участников процесса обучения, а также создание возможностей для творчества, рефлексии, для использования субъектности участников процесса. Для моделирования использовались различные нотации: eEPC и диаграммы взаимодействия и поведения субъектов. Первая нотация относится к классической методологии моделирования ARIS, а вторая – к субъектно-ориентированной методологии управления процессами Metasonic. Показано, что удовлетворение всех требований к процессу обучения обеспечивается при субъектно-ориентированном подходе и практически невозможно при классическом подходе. Определены принципы разделения обобщенного процесса обучения на мелкие процессы, разработаны их модели в виде диаграмм взаимодействия и диаграмм поведения субъектов. Представлены возможности изменения процесса обучения участниками процесса без программирования, с учетом автоматизации генерации приложения в Metasonic S-BPM Suite. Результаты исследования могут быть полезны для любых организаций, задумывающихся о переходе от традиционной жесткой структуры к более современной рефлексивной организации с сетевым взаимодействием сотрудников. |
Математические методы и алгоритмы бизнес-информатики
|
53–62
|
Малыженков Павел Валерьевич - кандидат экономических наук, PhD, профессор кафедры информационных систем и технологий, факультет бизнес-информатики и прикладной математики, Национальный исследовательский университет «Высшая школа экономики» Адрес: 603155, г. Нижний Новгород, ул. Б.Печерская, 25/12. E-mail: pmalyzhenkov@hse.ru
Бабкина Татьяна Сергеевна - старший преподаватель кафедры прикладной математики и информатики, факультет бизнес-информатики и прикладной математики, Национальный исследовательский университет «Высшая школа экономики» Адрес: 603155, г. Нижний Новгород, ул. Б.Печерская, 25/12. E-mail: tbabkina@hse.ru
Сергеев Алексей Игоревич - аспирант кафедры информационных систем и технологий, факультет бизнес-информатики и прикладной математики, Национальный исследовательский университет «Высшая школа экономики» Адрес: 603155, г. Нижний Новгород, ул. Б.Печерская, 25/12. E-mail: aisergeev07bi@gmail.com
Современная экономическая среда подвержена глубоким преобразованиям условий функционирования бизнеса вследствие финансового кризиса. В настоящее время и организационная гибкость становится наиболее важной характеристикой предприятий. В свою очередь, это предполагает принятие предприятиями таких организационных структур, в которых бизнес-отношения и ИТ-инфраструктура признаются как специфический тип ресурса, который может использоваться компанией для достижения конкурентного преимущества. Настоящее исследование анализирует различные аспекты гибкой организации и моделей предприятий, которые влияют на функциональность и архитектурные ограничения информационных систем предприятия. Для анализа авторы прибегают к концепции транзакционного механизма и особой методологии проектирования. Статья предлагает рассмотреть ключевые свойства четырех гибких организационных форм в тесной связи с подходом формального моделирования Онтологии Предприятий и методологии ДЕМО, которые следуют перспективе «язык-действие». |
Программная инженерия
|
63–71
|
Пащенко Денис Святославович - кандидат технических наук, MBA, независимый консультант в области разработки программного обеспечения E-mail: denpas@rambler.ru
Блинов Андрей Олегович - доктор экономических наук, профессор кафедры общего менеджмента, факультет менеджмента, Финансовый университет при Правительстве РФ; член-корреспондент Российской академии естественных наук (РАЕН). Адрес: 125993, г. Москва, Ленинградский проспект, 49. E-mail: aoblinov@mail.ru
Данная статья посвящена проблемам внедрения изменений и улучшений в процессные модели производства программного обеспечения (ПО) в регионе СНГ, обычно сопровождаемые специфическими рисками и организационным сопротивлением при слабости формальных корпоративных структур управления изменениями. Все выводы и заключения основаны на авторском исследовании, проведенном в конце 2013 года и охватившем 21 руководителя софтверных компаний из СНГ. Исследование было направлено на решение актуальных проблем стандартизации и сертификации производства ПО, организационное сопротивление и другие особенности внедрения изменений на уровне всей компании. В статье приведены необходимые организационные меры, поддерживающие внедрение изменений на этапах планирования, подготовки коллектива и проведения самих изменений. Эксперты установили важность системного подхода к внедрению изменений, включая активности по формальному планированию изменений и созданию отдельной команды для внутреннего проекта. Также эксперты рассказали о своем практическом опыте и результатах: типичных проблемах, методах закрепления изменений, сроках преобразований. Авторы резюмировали итоги исследования, рекомендовав использовать четырехстадийный жизненный цикл изменений, управление общими и специфическими рисками на всех стадиях, формализацию управления изменениями и использование результатов анализа достигнутых изменений в будущей практике. |
Математическое моделирование социально-экономических процессов
|
72–77
|
Богданова Татьяна Кирилловна - кандидат экономических наук, доцент кафедры бизнес-аналитики, факультет бизнес-информатики, Национальный исследовательский университет «Высшая школа экономики» Адрес: 101000, г. Москва, ул. Мясницкая, д. 20. E-mail: tanbog@hse.ru
Яковец Татьяна Юрьевна - кандидат экономических наук, член-корреспондент Российской академии естественных наук, докторант Института социально-экономических проблем народонаселения Российской академии наук Адрес: 117218, г. Москва, Нахимовский пр-т, д. 32. E-mail: tzag@mail.ru
В 1971 в Нобелевской лекции С.Кузнец отметил, что за последние 1-2 десятилетия рост населения перестает быть основными двигателем экономического роста. В связи с этим авторами исследуется современная демографическая ситуация в мире на базе информации, приведенной в прогнозах ООН. Описывается методология глобального демографического баланс, включающего пять возрастных когорт населения для 20 стран и регионов мира для прошлого периода, для 1950-2010 гг. и прогноза ООН до 2050 года. С его помощью количественно анализируется демографическая ситуация в развитых, наименее развитых и развивающихся странах мира. Для развитых стран мира, прошедших демографический переход, в ХХI веке будет характерен режим депопуляции населения. Приводится возрастная структура депопуляционных тенденций в этих странах. В наименее развитых странах рост населения продолжается, но уже не такими высокими темпами, как во второй половине ХХ века. Для развивающих стран особо выделяются страны БРИКС. Для оценки качественных характеристик стран мира используется Индекс развития человеческого потенциала (ИРЧП). Даются характеристики данного индикатора, приводимые Программой развития ООН. Приводятся значения ИРЧП для стран БРИКС и делается вывод о необходимости качественного роста экономик этих стран. Приводятся результаты моделирования и прогнозирования Г.П.Горшковым, Б.М.Долгополовым и А.А.Акаевым численности населения мира с учетом предельной емкости биосферы. Делается вывод о том, что прогнозы С.П.Капицы и экспертов ООН, сделанные без учета предельной емкости биосферы, более реалистичны. |
|
|